Extraction de biclusters à valeurs similaires avec l’analyse de concepts triadiques

نویسندگان

  • Mehdi Kaytoue
  • Sergei O. Kuznetsov
  • Juraj Macko
  • Amedeo Napoli
چکیده

Biclustering numerical data became a popular datamining task in the beginning of 2000’s, especially for analysing gene expression data. A bicluster reflects a strong association between a subset of objects and a subset of attributes in a numerical object/attribute data-table. So called biclusters of similar values can be thought as maximal sub-tables with close values. Only few methods address a complete, correct and non redundant enumeration of such patterns, which is a well-known intractable problem, while no formal framework exists. In this paper, we introduce important links between biclustering and formal concept analysis. More specifically, we originally show that Triadic Concept Analysis (TCA), provides a nice mathematical framework for biclustering with a better algorithmic scalability over existing methods.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Caractérisation et extraction de biclusters de valeurs similaires avec l'analyse de concepts triadiques

Résumé. Le biclustering de données numériques est devenu depuis le début des années 2000 une tâche importante d’analyse de données, particulièrement pour l’étude de données biologiques d’expression de gènes. Un bicluster représente une association forte entre un ensemble d’objets et un ensemble d’attributs dans une table de données numériques. Les biclusters de valeurs similaires peuvent être v...

متن کامل

Biclustering of Gene Expression Data Based on Local Nearness

Résumé. L’analyse des données d’expression de génes dans les fragments d’ADN est un outil important utilisé dans la recherche genomique dont les objectifs principaux s’étendent de l’étude du caractére fonctionnel des génes spécifiques et leur participation dans les processus biologiques à la reconstruction de conditions des maladies et leur pronostique. Les données d’expression des génes sont a...

متن کامل

Extraction de Règles en Incertain par la Méthode Implicative

Résumé. En relation avec des approches classiques de l’incertain, l’analyse statistique implicative (A.S.I.) peut apparaître innovante, particulièrement pour l’opérateur d’implication. L’article montre en effet que la notion de variables à valeurs intervalles et celle de variables-intervalles sont efficaces dans la détermination de leur distribution et dans la recherche de règles entre variable...

متن کامل

Khiops: outil d'apprentissage supervisé automatique pour la fouille de grandes bases de données multi-tables

Résumé. Khiops est un outil d’apprentissage supervisé automatique pour la fouille de grandes bases de données multi-tables. L’importance prédictive des variables est évaluée au moyen de modèles de discrétisation dans le cas numérique et de groupement de valeurs dans le cas catégoriel. Dans le cas d’une base multi-tables, par exemple des clients avec leurs achats, une table d’analyse individus ×...

متن کامل

Intégration interactive de contraintes pour la réduction de dimensions et la visualisation

Résumé. Il existe aujourd’hui de nombreuses méthodes de réduction de dimensions, que ce soit dans un cadre supervisé ou non supervisé. L’un des intérêts de ces méthodes est de pouvoir visualiser les données, avec pour objectif que les objets qui apparaissent "visuellement" proches soient similaires, dans un sens qui correspond aux connaissances d’un expert du domaine ou qui soit conforme aux in...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2012